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摘要 : 【目的 ]Ty3/gypsy 反 转 座 子 是 广泛 存在 于 生物 体内 的 一 类 反 转 座 子 。 反 转 座 子 上 的 天 冬 氮 酰 和 蛋白酶 (aspartic 
protease, AP) 基因 是 反 转 座 子 发 生 转 座 所 需 的 一 个 重要 基因 。 但 由 于 该 基因 家 族 成 员 间 变 异 较 大 , 较 难 利用 简 并 引 
物 克 隆 得 到 该 基因 ,所 以 对 该 基因 家 族 成 员 的 研究 很 少 。【 方 法 】 本 研究 采用 PCR 方法 克隆 了 二 化 蜡 Ty3/gypsy 反 转 
座 子 的 AP 基因 序列 ,并 对 其 序列 特征 和 地 理 种 群 变 异 进行 了 分 析 。[【 结果 】 克隆 获得 的 二 化 量 Chilo suppressalis 
(Walker) Ty3/ gypsy 反 转 座 子 中 的 AP 基因 具有 独立 的 开放 阅读 框 (open reading frame, ORF) ,长 528 bp ,编码 的 蛋白 
含 175 个 氮 基 酸 残 基 ( GenBank 登录 号 :KF886014)。Conserved Domain Search 在 线 工 具 分 析 显 示 , 该 蛋白 中 含有 一 个 
特异 的 Asp. protease 2 保守 功能 域 。 从 7 个 二 化 旦 不 同 地 理 种 群 中 共 克 隆 获 得 70 份 AP 基因 拷贝 。 对 同一 基因 座位 
上 的 AP 序列 多 重 比 对 分 析 ,发 现 共 存在 46 处 碱 基 蔡 换 ,其 中 碱 基 转换 (transition) 有 31 Ab , d E fut ( transversion ) 有 
15 处 ,70 份 拷贝 中 有 69 份 拷贝 是 完整 的 ORF ,能 编码 完整 的 蛋白 。 从 碱 基 蔡 换 形式 看 ,A 一 G 的 变异 形式 出 现 最 多 ， 
有 15 处 ;其 次 是 TC 的 变异 形式 ,有 11 处 ;其 余 的 变异 形式 都 很 少 。 对 比 这 7 个 不 同 地 理 种 群 ,没有 发 现 碱 基 的 蔡 
换 存在 明显 的 地 理 区划 差 异 。【 结 论 ] 碱 基 的 替换 形式 与 二 化 旦 所 处 的 地 理 区 域 无 明显 相关 性 。 本 研究 对 于 认识 反 
转 座 子 序列 的 变异 特点 有 所 帮助 。 
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Molecular cloning and analysis of aspartic protease ( AP) gene in Ty3/ 
gypsy retrotransposon in different geographical populations of Chilo 
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Abstract: [ Aim] Ty3/gypsy is a retrotransposon that is widespread in many organisms. Aspartic protease 
(AP) gene is important for the retrotransposon transposition. Since the AP gene is difficult to be cloned 
based on degenerate primers because the members of AP family have low similarities, there are few 
researches about AP genes. [Methods] The AP gene in Ty3/gypsy retrotransposon was cloned from Chilo 
suppressalis ( Walker) with PCR method, and its sequence characteristics and variations in the Chinese 
populations were analyzed. [Results] The AP gene has a single open reading frame ( ORF) of 528 bp 
encoding a protease of 175 amino acids ( GenBank accession no. : KF886014). The Conserved Domain Search 
analysis showed that there is a conserved Asp, protease, 2 domain in this AP protein. Seventy copies of AP 
gene were cloned from 7 field populations. Multiple sequences alignment revealed that there are 46 single-base 
substitutions including 31 transitions and 15 transversions. Sixty-nine of 70 copies have intact ORF. The base 
changes of A—G (15) and T—C (11) occur more frequently than the others. [Conclusion] There is no 
significant relationship between the patterns of base substitutions and the distribution area of C. suppressalis. 


This study will be helpful to investigate the variation features of retrotransposon. 








A 
作 








者 










































































项 目 : 国家 水 稳产 业 技 术 体系 项 目 ( Cars-001-25 ) ; 国家 自然 科学 基金 项 目 (31201505 ) ; 江苏 省 农业 科技 自主 创新 资金 项 目 CX(13 )5025 
简介 : FRR, 女 , 1989 年 生 , 辽宁 辽阳 人 , 硕士 研究 生 , 研究 方向 为 昆虫 分 子 生物 学 , E-mail: xhli2012€ 163. com; 罗 光 华 , 男 , 1982 年 
^E, 江苏 溧阳 人 ，, 博士 , 副 研 究 员 , 研究 方向 为 粮食 作物 虫害 , E-mail: luogh_cn@ 163. com 























# 闪 同 第 一 作者 Authors with equal contribution 


“通讯 作者 Corresponding author, E-mail; fangjc@ jaas. ac. cn 
收 稿 日 期 Received; 2013-11-28; 接受 日 期 Accepted; 2014-04-11 





























5 期 李 晓 欢 等 : 不 同 地 理 种 群 二 化 蜡 Ty3/gypsy RERET RA AWE A MEAP) 基因 序列 的 克隆 与 分 析 531 





























Key words. Chilo suppressalis; retrotransposon; Ty3/gypsy; aspartic protease ( AP); gene cloning; 


sequence analysis 





转 座 子 是 一 段 DNA. 序列 ,能 够 不 依靠 同 源 重 组 
而 在 宿主 基因 组 内 移动 。 起 初 转 座 子 被 认为 是 垃圾 
DNA 序列 ,在 宿主 体内 无 生物 学 功能 ( Doolittle and 
Sapienza, 1980) ,但 现在 已 经 明确 , 转 座 子 是 宿主 基 
因 组 的 重要 组 成 部 分 ,是 宿主 进化 的 重要 内 在 动力 
之 一 (Kidwell and Lisch, 2000; Kidwell, 2002; 
Kazazian, 2004) , 

按照 转 座机 制 和 序列 特征 可 将 转 座 子 分 为 两 大 
类 ,第 一 大 类 是 RNA 型 转 座 子 ,也 称 为 反 转 座 子 , 通 
过 "复制 -粘贴 ”的 方式 进行 转 座 , 该 类 转 座 子 每 发 
生 一 次 转 座 则 在 宿主 基因 组 中 多 一 份 自身 的 拷贝 ， 
因此 转 座 活性 越 强 ,其 在 宿主 染色 体内 的 拷贝 数 就 
越 多 , 由 此 增加 了 宿主 基因 组 的 容量 ( Finnegan, 
1997) 。 第 二 类 是 DNA 型 转 座 子 ,通过 剪 切 -粘贴 ” 
的 方式 进行 转 座 ,在 转 座 酶 的 作用 下 , 转 座 子 自身 直 
接 从 宿主 基因 组 的 一 个 位 点 转移 到 另 一 个 位 点 ,不 
会 对 宿主 基因 组 的 大 小 产生 影响 ,但 能 导致 宿主 核 
酸 序列 的 转移 和 序列 位 置 的 变化 (Feschotte and 
Pritham, 2007) 。 

反 转 座 子 是 种 类 最 多 、 分 布 最 广 的 转 座 子 类 型 。 
反 转 座 子 根据 5' 和 3' 端 末端 重复 序列 的 有 无 ,分 为 
长 末端 重复 (long terminal repeat, LTR ) 反 转 座 子 和 
非 长 末端 重复 (non-long terminal repeat, non-LTR ) 
反 转 座 子 (Bennetzen ，1996 ) 。LTR 反 转 座 子 又 可 以 
分 为 5 个 超 家 族 (superfamily ): Tyl/Copia 
( Pseudoviridae ), Ty3/Gypsy ( Metaviridae ) ， Bel/ 
以 及 ERV  ( endogenous 
retroviruses) 。 直 到 现在 ,后 3 个 超 家 族 成 员 只 在 后 
生动 物体 内 发 现 , 而 Ty 1/ Copia I Ty3/ Gypsy 两 个 超 
家 族 成 员 在 所 有 真 核 生 物体 内 都 有 发 现 ( Muszewska 
et al., 2011) , Ty1/Copia 和 Ty3/Gypsy 的 区 别 就 在 
于 所 编码 的 多 聚 蛋 白 中 整合 酶 (integrase，INT) 的 位 
置 差异 (Kumar and Bennetzen, 1999; Muszewska et 
al., 2011), 

LTR 反 转 座 子 中 都 含有 一 段 编码 天 冬 氮 栈 蛋白 
酶 (aspartic protease, AP) 的 序列 。 该 蛋白 酶 属于 逆 
转录 病毒 蛋白 酶 类 似 天 冬 酰胺 和 蛋白酶 家 族 
(retroviral pepsin-like aspartate protease family ) ,该 家 
族 一 般 含 有 180 ~ 230 个 氨基 酸 残 基 , 其 CR Jm TH 
对 较 保守 ,N- 末 端 变化 较 大 。 天 冬 酰 胺 蛋白 酶 家 族 
成 员 之 间 相 似 度 较 低 , 所 以 较 难 通过 同 源 克隆 获得 
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该 蛋白 酶 家 族 成 员 。 现 在 已 报道 的 该 蛋白 酶 家 族 成 
员 大 多 数 是 借助 于 生物 信息 学 工具 从 各 种 类 型 的 数 
据 中 发 掘 得 到 的 (Liorens et al., 2009), LTR 反 转 
座 子 所 编码 的 天 冬 氨 酰 蛋白 酶 ( AP) ,其 在 反 转 座 子 
内 部 可 以 是 一 个 独立 的 ORF, 也 可 以 与 反 转 录 酶 
(reverse transcriptase, RT), RNA # H ( RNase H, 
RH) 以 及 整合 酶 (INT) 共存 在 一 个 ORF H (Flavell 
et al., 1997 ; Havecker et al., 2004; Muszewska et al., 
2011), fE LTR RETF, RAAME ANAP) 
的 作用 是 在 反 转 座 子 转 座 的 过 程 中 负责 将 反 转 座 子 
表达 的 多 聚 体重 白 切 割 成 能 行使 功能 的 成 熟 蛋白 产 
物 (Muszewska et al., 2011) 。 因 此 ,对 LTR 反 转 座 
子 AP 的 研究 可 以 帮助 了 解 LTR 反 转 座 子 的 变异 规 
律 ,进而 为 深入 解析 反 转 座 子 的 增殖 扩散 规律 及 沉 
默 失 活 机 制 提供 理论 依据 。 

本 研究 从 水 稻 的 重要 害虫 二 化 蜡 Chilo 
suppressalis (Walker) 体 内 克隆 Ty3/ gypsy 反 转 座 子 的 
AP 序列 ,利用 相关 生物 信息 学 工具 对 该 AP 序列 进 
行 分 析 , 从 而 认识 其 重要 的 分 子 生 物 学 结构 与 特征 。 
此 外 ,比较 分 析 了 不 同 二 化 坚 地 理 种 群 中 该 AP 序列 
的 变异 ,以 此 探讨 宿主 所 处 的 不 同 地 理 区 域 与 内 源 性 
转 座 子 序列 的 变异 的 关系 ,以 期 为 揭示 二 化 旦 的 
Ty3/ gypsy 反 转 座 子 遗传 进化 规律 提供 有 用 的 信息 。 



























































1 材料 与 方法 


1.1 不 同 地 区 二 化 旦 种 群 的 采集 

于 2010 年 12 月 至 2011 年 2 月 沿 长 江 流域 ,分 
别 从 四 川 德阳 (104°20'36”E, 312756" N) .重庆 江津 
(106?15'54"E ,29?8 28"N) ,湖北 荆州 (112°20'29"E， 
30°16'48"N) .湖南 湘 阴 (112°54'28'E,28°38'45”N)、 
江西 瑞 昌 (115°11'22"E,28°43'38"N) 安徽 和 县 
(118?21/25"E,31?43'3"N) ILERE ( 121?31'43" 
E,29?48'26"N) HKR EH A RREZE 18 , RAE ISI 
幼虫 经 饥饿 处 理 后 浸泡 于 无 水 乙醇 中 , 置 于 -80Y 
冰箱 冻 存 备用 。 
1.2 基因 组 DNA 的 提取 

利用 Axygen 公司 的 基因 组 提取 试剂 盒 ( Axygen 
生物 科技 有 限 公 司 , 杭 州 ) SEX (6 08 B5 dE DS] 2H 
DNA(gDNA)。 提 取 gDNA 时 取 单 头 二 化 旦 ,用 吸水 
纸 将 虫 体 表面 的 乙醇 吸 干 后 用 液 氮 速冻 虫 体 ,再 用 
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研磨 棒 研 磨 至 粉末 状 ,之 后 按照 基因 组 提取 试剂 盒 
的 使 用 说 明 书 进行 操作 。 提 取 的 gDNA 作为 后 续 
PCR 的 模板 ,于 -20%C 保存 。 
1.3 总 RNA 提取 及 第 一 链 cDNA 模板 的 制备 
每 个 地 理 种 群 随机 挑选 二 化 量 3 龄 幼虫 2 头 ， 
提取 总 RNA。 总 RNA 的 提取 使 用 SV Total RNA 
Isolation Kit 试剂 盒 ( Promega 公司 ， 美国 ) ,具体 操作 
步 又 依照 说 明 书 。 提 取 的 总 RNA PUEI ER EB Yk 
和 紫外 分 光 光 度 计 检测 质量 后 ,用 PrimeScript II 1st 
Strand cDNA Synthesis Kit 反 转 录 试 剂 盒 ( 大 连 宝 
物 公司 ,大连 ) 反 转录 合成 第 一 链 cDNA。 反 转录 产 
WF -20C 保存 备用 
1.4 ZEE Ty3/gypsy 反 转 座 子 AP 序列 的 克隆 
根据 我 们 早先 克隆 的 二 化 量 Ty3/ gypsy 反 转 座 
子 序列 Csu-Ty3 ( GenBank 登录 号 :KJ191261 ) ， 设计 
特异 引物 克隆 该 Ty3/gypsy 反 转 座 子 的 AP 序列 。 
所 设计 的 引物 为 : Ty3-APF1: 5'-GAGGAAGCGA 
TAAGGGATCA-3', Ty3-APRI: 5’-TGAAGCTTGCC 
TACITAACAGAG-3', 引物 位 于 Ty3/gypsy 反 转 座 
子 序列 中 AP 结构 域 两 端 旁人 出 。 以 二 化 蜡 gDNA 为 
模板 ,使 用 该 对 引物 克隆 Ty3/gypsy 反 转 座 子 的 AP 
序列 。 利 用 TaKaRa 公司 (大 连 宝 生物 公司 ) 的 LA 
Tag 酶 进行 扩 增 , 共 25 uL 反应 体系 : 含 2.5 pL 的 
10 x PCR Buffer, 2.5 uL 的 浓度 为 25 mmol/L 的 
MgCl, 2 uL 的 浓度 均 为 2.5 mmol/L 的 dNTPs 0.25 
kL 的 浓度 为 5 UA/pL 的 LA Taq 酶 .浓度 均 为 10 
pmol/L 的 上 下 游 引物 各 1 uL, PCR 扩 增 程序 为 : 
95*C 预 变 性 3 min;94% 变性 30 s,56% 退火 30 s, 
72% 延伸 45 s, 进行 32 个 循环 ;最 后 72°C 延伸 10 
min。 同 时 ,以 二 化 量 cDNA 为 模板 ,引物 、 反 应 体系 
及 扩 增 程序 均 同 上 。 扩 增 Ty3/gypsy 反 转 座 子 AP 
结构 域 的 cDNA 序列 。 
PCR 产物 用 1. 5% 的 琼脂 糖 凝 胶 进 行 电泳 检 
测 , 温 化 乙 狂 (EB) 染 色 后 将 潜在 的 目标 条 带 切 割 下 
来 ,利用 DNA. 凝 胶 回收 试剂 盒 (天 根 生物 技术 有 限 
公司 ,北京 ) 回 收 PCR 产物 。 回 收 的 DNA. 产物 连接 
至 pEASY-T3 克隆 载体 (北京 全 式 金 生物 技术 有 限 
公司 ,北京 ) ,转化 后 挑 取 单 克隆 摇 菌 培养 并 测序 。 
1.5 ZWEE Ty3/gypsy 反 转 座 子 AP 的 分 析 
将 该 AP 的 核酸 序列 在 NCBI 的 Nucleotide 
Collection ( nr/nt ) Whole-Genome Shotgun Contigs 
(wgs ) 2 3 Æ ( http://www. nebi. nlm. nih. gov/ 
blas/) 中 利用 BLASTN 工具 进行 同 源 搜索 ; 利用 
NCBI 的 Conserved Domain Search 在 线 分 析 工 具 












































( http://www. ncbi. nlm. nih. gov/Structure/cdd/ 
wrpsb. cgi) 对 该 蛋白 进行 保守 结构 域 预测 分 析 ; 使 用 
在 线 分 析 工 具 SignalP 4. 1 Server ( http ;// www. cbs. 
dtu. dk/services/SignalP/) 预测 该 AP 蛋白 的 信号 肽 
序列 ;使 用 TMpred 跨 膜 蛋白 预测 在 线 分 析 工 具 
( http://www. ch. embnet. org/software/TMPRED _ 
form. html) 对 该 AP 蛋白 进行 跨 膜 区 分 析 ; 利用 
PredictProtein 在 线 工 具 ( https://www. predictprotein. 
org/ ) 对 AP 和 蛋白 的 二 级 结构 等 进行 预测 分 析 。 
1.6 二 化 蝇 不 同 地 理 种 群 的 Ty3/gypsy 反 转 座 子 
AP 基因 的 变异 分 析 

为 比较 二 化 蛙 Ty3/ gypsy 反 转 座 子 同一 拷贝 中 
AP 基因 的 变异 ,首先 基于 我 们 前 期 克隆 获得 的 该 
Ty3/gypsy 反 转 座 子 的 旁 侧 序列 设计 特异 引物 (Ty3- 
flkF:S'-ATCCATTCCCCTCCTCTTAT-3 和 Ty3-flkR : 
5'-TACACAATAGAGCGTTCTGCTAC3'), È £T 
Flank-PCR , 扩 增 二 化 晤 不 同 地 理 种 群 中 同一 基因 座 
位 上 Ty3/aypsy 反 转 座 子 拷贝 。 利 用 TaKaRa 公司 
(大 连 宝 生物 公司 ) 的 LA Taq 酶 进行 扩 增 。Flank- 
PCR 的 扩 增 程序 为 :95Y 预 变 性 3 min;94% 变性 30 
s,58C3B Jc 30 s,72C 延伸 5 min 20 s, 进 行 30 个 循 
环 ;最 后 72%C 延伸 10 min。 扩 增产 物 回收 后 作为 后 
续 PCR 的 模板 。 再 利用 前 述 的 特异 引物 CTy3- 
APF1: 5'-GAGGAAGCGATAAGGGATCA-3' 和 Ty3- 
APRI; S$'-TCAAGCTTGCCTACTTAACAGAG-3 ) ,以 
Flank-PCR 的 回收 产物 为 模板 ,克隆 Ty3/gypsy 反 转 
座 子 同 一 拷贝 上 的 AP 序列 。PCR 扩 增 程序 为 : 
95*C 预 变 性 3 min;94% 变性 30 s,56% 退火 30 s, 
72% 延伸 45 s, 进行 32 个 循环 ;最 后 72% 延伸 10 
min。 将 目标 条 带 切 割 下 来 后 回收 、 连 接 、 转 化 、 挑 取 
单 克隆 JE ERRAT UTE ,使 用 的 试剂 与 操作 方法 同 
上 。 每 个 地 理 种 群 中 , 随机 挑选 10 头 个 体 , 单 头 提 
取 基 因 组 DNA ,作为 Flank-PCR 的 模板 。 

利用 MEGA 4 软件 对 从 不 同 地 理 种 群 中 克隆 得 
到 的 AP 基因 核酸 序列 进行 分 子 系统 进化 分 析 , 采 
用 最 大 简约 法 (maximum parsimony, MP)1 000 KE 
复 构建 分 子 系统 进化 树 。 


2 结果 与 分 析 



























































2.1 ZWE Ty3/gypsy 反 转 座 子 中 AP 基因 的 序 
列 与 结构 预测 

ZAER Ty3/gypsy 反 转 座 子 的 AP 基因 核 昔 酸 
序列 长 528 bp ,在 二 化 旦 Ty3/eypsy 反 转 座 子 中 是 
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一 个 独立 的 ORF ,拥有 自身 的 起 始 密码 子 和 终止 密 
码 子 (研究 显示 ,在 有 的 反 转 座 子 中 ,AP 基因 序列 
结构 会 被 包含 在 整个 pol 多 聚 体 基因 中 ,不 具有 自 





身 的 起 始 密 码 子 和 终止 密码 子 ) ,其 编码 含 175 个 
氮 基 酸 残 基 的 蛋白 (图 1) 。 以 cDNA 为 模板 进行 的 
PCR 扩 增 ,同样 能 获得 相同 的 序列 。 


1 ATGITIGIGCATCCCATGAAACAAGAAAAGGAAGAACAAAGAGAAGCGTGCGTIGAATAGAGTGGCGCAGAATTTTATT 
1 M FV H PM Kk QE Kk E E Q RE ACVNRV A GNI 
T8 TGITACAGGIGIGGACATAAAGGACATACAGCAAAGGATAGTAAATGTCCGGCAGCATCCGAGAAATGTGACAAGTGT 
27 C Y RC EG HE G H T Ai RKR DS KC PF A A SE RCDREKC 
157 GGACTGAAGGGACATTTTGCAAAGTGTTGCAAAACTCAAAGCAAGAATGGTAAAAGGAAGAAGAGGCATGTGAAATAC 
53 G L Kk G H FE À Kk C C K T 0 5 KE NG KE RE EK R H V EK Y 
235 ATTGTTCCAAATGAGAGIGATTCTAAATCGTCGGAAGCAGATGACAATAATGAAAGTGAGAATGAACACATAGAAATG 
79 I v ENES DS EK 35535 E AD DNNE S ENEH I E M 
313 AATTCAATATTTACAATAAGTAGTATGGACAATAAGTGTACAGTACTGATAGATGATAAATTTCCTTGTCAATTTATT 
105 N 5 I E T I 5 5 M BD N &K C I Y» L I D D EE F P C Q EF I 
381 ATAGATTCTGGAGCTTCAATAAACATTGTAGACAAACACACATTTAATAAATTAATTAGTTCAGGATTTTGTTGTAAA 
131 I D 5 G A 5 I N I V DE H T FE NE LIS 5 6 F C C K 
468 CIGACAAAAAGTAAGGAAAAGTACTTTGCTTATGGAGGGAGAGAGTTAGATAAGTTATGA 

157 h. T E 5 RE E EF Y E A Y GG G E E L D E h * 





图 1 AKIE Ty3/gypsy 反 转 座 子 上 AP 基因 的 核酸 序列 以 及 推导 的 蛋白 序列 


Fig.1 Nucleotide and putative amino acid sequences of AP gene in retrotransposon Ty3/gypsy from Chilo suppressalis 


星 号 表示 终止 密码 子 。The asterisk indicates the stop codon. 


将 该 AP 核酸 序列 在 NCBI 的 Nucleotide 
collection (nr/nt) 数 据 库 中 进行 BLSATN 分 析 , 当选 
择 Highly similar sequences (megablast ) 程序 时 搜索 不 
到 任何 同 源 序列 ; 当选 择 More dissimilar sequences 
(discontiguous megablast ) 程序 时 仅 搜索 到 一 条 序列 ， 
所 显示 的 上 上 值 为 3.3, 而 且 两 者 之 间 也 只 有 32 bp 是 匹 
配 的 ; 当选 择 Somewhat similar sequences ( blastn ) 程序 
时 能 搜索 出 很 多 序列 ,但 这 些 序列 都 是 一 些 物种 的 基 
因 组 或 其 他 组 学 的 序列 ,尚未 被 进一步 的 研究 确认 ,此 
外 所 有 这 些 搜寻 结果 中 下 值 最 低 为 0.002。 将 该 AP 
核酸 序列 在 NCBI 的 Whole-Genome Shotgun contigs 
(wgs) 数 据 库 中 进行 BLSATN 分 析 , 获 得 的 结果 与 上 述 
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结果 相似 。 将 该 AP 蛋白 序列 进行 BLASTP 分 析 , 选 择 
的 搜索 程序 为 BLASTP (protein-protein BLAST) ,搜索 出 
了 102 个 结果 (blast hits)。 这 些 hits 中 下 值 最 小 的 为 
7e-18 ,最 大 的 为 0. 14。 其 中 绝 大 部 分 序列 都 被 列 为 未 
知 功能 蛋白 ,少数 序列 归属 于 反 转 座 子 的 序列 。 
利用 NCBI 的 Conserved Domain Search 在 线 分 
析 工 具 进 行 分 析 , 结 果 显 示 该 蛋白 中 含有 一 个 特异 
的 Asp_protease_2 保守 功能 域 ,在 该 功能 域 中 有 一 
个 catalytic motif( 图 2) 。 利 用 在 线 分 析 工 具 SignalP 
4. 1 Server 进行 信号 肽 预测 ,没有 发 现 该 蛋白 中 存在 
HK. IH TMpred 在 线 分 析 工 具 分 析 跨 膜 
区 ,没有 发 现 跨 膜 区 结构 。 


in 125 150 175 
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图 2 二 化 坚 反 转 座 子 TyS/eypsy 上 AP 基因 蛋白 序列 保守 结构 域 预测 
Fig.2 Prediction of conserved domains of coding products of AP gene in retrotransposon Ty3/gypsy from Chilo suppressalis 
Inhibitor binding sites; 抑制 结合 位 点 ; Catalytic motif; 催化 功能 域 基 序 ; Catalytic residue; 催化 残 基 ; Specific hits: 特异 锚 定 匹配 ; Non-specific 
hits; 非特 异 锚 定 匹 配 ; Superfamilies: 超 家 族 ; Multi-domains: 多 重 结构 域 . 
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对 AP 有 蛋白 利用 PredictProtein 在 线 工 具 分 析 显 
示 , 在 AP 和 蛋白 二 级 结构 中 5.7% 的 氨基 酸 残 基 参与 
形成 螺旋 (helix) ,12.6% 的 氨基 酸 残 基 参 与 形成 片 层 
(strand) ,其 余 的 氨基 酸 残 基 则 参与 形成 环 (loop) ,其 


处 位 置 约 在 第 128 位 氨基 酸 附 近 ( 图 3)。Gene 
Ontology ( G0) 分析 中 可 信和 度 最 高 的 (38% ) 是 将 该 AP 
蛋白 的 分 子 生物 学 功能 归属 于 Protein Binding 这 一 
类 中 ,蛋白 结合 位 点 (Protein-Protein Binding) 分 析 显 











中 螺旋 所 处 的 位 置 约 在 第 145 位 氨基 酸 附 近 , 片 层 所 





示 该 AP 蛋白 中 散布 着 很 多 个 潜在 的 蛋白 结合 位 点 。 


Ust i an gs i ; eu M - PMCID MIRA d EE 2-2 3 EE od 
AA MFVHPMKQEKEEQREACVNRVAQNFICYRCGHKGHTAKDSKCPAASEKCDKCGLKGHFAK 
OBS sec 
PROF sec EE 
Rel sec 9 44555544444444455665 44444 445666664 44 5 
sub sec — [.....mm......... gm. ............. mmm. ........... g.... 
0 3$ acc bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb 
P 3$ acc eb eseeeseesceeee eee b b ec ee e ee eeeb eb cb b e 
Rel acc 32-3023 2 2 2223.12 Erg 2 
SUB HG Nd 
pec E E RNE E P ONERE MN TOTEM Nisi. eser R SN. [Drs T 
AA CCKTQSKNGKRKKRHVKYIVPNESDSKSSEADDNNE SENEHIEMNSIFTISSMDNKCTVL 
OBS sec 
PROF sec EEEE 
Rel sec 556555555554544444455555555655555555444 4555 4 
sus sec .[NWENENFETS ..... pwETENFENEFFEYFR............. ERI... .. 
O 3 acc bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb 
P 3 acc beeeeeeeeeeeee ee eeeee e e ee eee e e ee e eeee eb b 
Rel acc 2:272 2 3 2 
SUB acc ------------------------------------------------------------ 
m 13...,--...14...,-...15...,....16...,....17..., 
AA IDDKFPCOFIIDSGASINIVDKHTFENKLISSGFCCKLTKSKEKYFAYGGRELDKL 
OBS sec 
PROF sec EE EEEEEEE HHH | HHHHHHH EEEE EEE 
Rel sec 45 57776 565 55654 4654 4554 45 55 8 
sub sec — ...B..Bsaa.mm....... EXD....m...... m....B..m..... 
O 3 acc bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb 
P 3 acc eebeb bbbbbbb bbbb ssbbecsb eee e eeeeeeb eeeebeee 
Rel acc 22:2336362.12 34 232 pae 2123 2-3 4 
SUB acc ........ 四 .四 - -oo E 


图 3 











二 化 坚 反 转 座 子 Ty3/gypsy 上 AP 


基因 编码 蛋白 的 二 级 结构 预测 


Fig.3 Prediction of the secondary structure of the coded protein of AP gene in retrotransposon Ty3/gypsy from Chilo suppressalis 
E: HJ Strand; H: 螺旋 Helix; L: 环 Loop. SUB: 在 置信 度 范 围 内 校正 后 的 值 Correction value in confidence intervals. 预测 结果 以 SUB 值 为 准 。 





Predicted results are based on the SUB values. 


2.2 不 同 二 化 蝇 地 理 种 群 中 同 AP 的 变异 分 析 

在 7 个 不 同 地 理 种 群 的 二 化 坚 体 内 均 克 隆 到 了 
Ty3/ gypsy 的 AP 序列 , 共 获 得 70 份 找 贝 。 在 这 70 
份 拷贝 中 ,只 有 1 份 拷贝 (江津 种 群 中 的 第 3 号 样 ) 
存在 一 段 连续 的 297 bp 的 缺失 ,其 余 拷 贝 都 没有 碱 
基 的 缺失 ,也 没有 碱 基 的 插入 。 此 外 ,所 有 这 些 没有 
碱 基 插 入 和 缺失 的 拷贝 都 能 够 完全 翻译 通 , 即 不 存 
在 碱 基 的 无 义 突 变 ( nonsense mutation) 。 这 些 拷贝 
相互 之 间 保 持 着 极 高 的 相似 度 (除了 江津 种 群 中 的 
第 3 号 拷贝 , 因 其 有 较 大 片段 的 缺失 ) ,核酸 水 平 的 
相似 度 三 99% ,和 蛋白 水 平 的 相似 度 三 98% 。 这 表明 ， 























在 7 个 跨度 较 大 的 地 理 区 域 之 间 , 作 为 非 远 距离 迁 
飞 的 二 化 蜡 种 群 ,它们 同一 基因 座位 上 的 内 源 性 Ty3 
反 转 座 子 序列 没有 出 现 显著 的 差异 。 基 于 AP 基因 
核酸 序列 构建 的 分 子 系统 进化 树 (未 列 出 ) ,结果 显 
示 不 同 地 理 种 群 中 的 AP 基因 拷贝 没有 明显 的 聚 类 ， 
也 表明 该 基因 序列 在 不 同 地 理 种 群 中 变异 较 小 。 
序列 多 重 比 对 显示 ,共存 在 46 处 碱 基 蔡 换 ， 
中 碱 基 和 转换 ( transition) 有 31 Jb; 0h 3E Wi Me 
(transversion) 有 15 处 ( 表 1)。 对 于 碱 基 的 变异 ,从 
三 联 体 密码 子 的 位 置 上 来 分 析 , 密 码 子 第 3 位 出 现 
变异 的 次 数 最 多 ,有 20 处 ;第 1 位 和 第 2 位 出 现 变 
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异 的 次 数 相 同 , 均 为 13 处 。 碱 基 变 异 导 致 的 氨基 酸 
同 义 突 变 (synonymous mutation) Æ 18 处 , 且 均 出 现 


变 (missense mutation) £j 28 处 ,有 13 处 均 出 现在 密 
码 子 第 1 位 和 第 2 位 ,还 有 2 处 出 现在 密码 子 第 3 














在 密码 子 的 第 3 位 ; 碱 基 变 异 导 致 的 氨基 酸 错 义 突 


位 ( 表 1)。 


表 1 二 化 旺 反 转 座 子 Ty3/gypsy 上 AP 基因 序列 的 变异 情况 


Table 1 Substitution mutations of AP genes in retrotransposon Ty3/gypsy from Chilo suppressalis 


























碱 基 转 换 Transition Ti AE Rid. Transversion 
密码 子 中 位 置 Position in codon 密码 子 中 位 置 Position in codon 
第 1 位 第 2 位 第 3 位 第 1 位 第 2 位 第 3 位 
Position 1 Position 2 Position 3 Position 1 Position 2 Position 3 
EN hls EAE 
不 同位 置 上 的 变异 1 数 11 6 14 2 7 6 
Number of substitutions 
y zd 
同 义 突变 数 0 0 14 0 0 4 
Number of synonymous mutations 
y Zink 
销 义 突变 数 11 6 0 2 7 2 
Number of missense mutations 
Y AARE 
无 义 突变 数 0 0 0 0 0 0 
Number of nonsence mutations 
POT 
[71 信之 开心 数 31 15 


Total number of base substitutions 


从 变异 形式 上 分 析 碱 基 的 变异 ,A 一 G 的 变异 
形式 出 现 最 多 ,有 15 处 ;其 次 是 TC 的 变异 形式 ， 
有 11 处。 其 余 的 变异 形式 都 很 少 , 其 中 未 发 现 C 一 
T fil CA 的 变异 形式 ( 表 2)。 对 比 这 7 个 不 同 地 
理 种 群 , 没 有 发 现 碱 基 的 替换 存在 明显 的 地 理 区 划 
差异 ,这 显示 该 转 座 子 的 序列 变异 与 宿主 二 化 蜡 所 
处 的 地 理 区 域 无 明显 相关 性 。 

R2 二 化 蜡 反 转 座 子 Ty3/gypsy 上 AP 基因 序列 


间 单 碱 基 蔡 换 形式 
Table 2 Single-base substitution patterns of AP genes 





























in retrotransposon Ty3/gypsy from Chilo suppressalis 

















密码 子 中 位 
Substitution Forms Number of 第 1 位 第 2 位 第 3 位 
type substitutions 
Position 1 Position 2 Position 3 
A—G 15 7 2 6 
碱 基 转 换 G—A 5 2 0 3 
Transition T—C 11 2 4 5 
CT 0 0 0 0 
A—T 3 0 1 2 
T 一 人 3 0 0 3 
A 一 C 1 0 1 0 
碱 基 颠 换 C—A 0 0 0 0 
Transversion G—T 2 0 2 0 
TG 1 0 0 1 
G—C 2 2 0 0 
C 一 C 3 0 3 0 
3 讨论 


本 研究 首次 克隆 获得 二 化 蛙 Ty3/gypsy 反 转 座 


子 的 天 冬 氮 栈 蛋白酶 (AP) 基因 序列 。 该 AP 基因 
的 BLASTNZP 分 析 均 未 找到 相似 ( 同 源 ) 序 列 ,或 只 
有 个 别 E 值 较 高 而 且 尚 未 研究 确证 的 序列 片段 ,这 
表明 目前 对 于 反 转 座 AP 基因 序列 的 研究 较 少 。 相 
关 报 道 认为 天 冬 酰胺 蛋白 酶 家 族 成 员 之 间 相 似 度 较 
低 (Llorens et al., 2009; Muszewska et al., 2011) ,这 
可 能 是 我 们 进行 BLAST 分 析 找 不 到 相似 ( 同 源 ) 序 
列 的 原因 。 由 此 , 意味 着 对 AP 序列 的 同 源 克 隆 较 
困难 ,这 或 许 也 是 目前 AP 序列 研究 较 少 的 原因 。 
鉴于 此 ,本 研究 对 我 们 更 系统 地 认识 反 转 座 子 的 AP 
基因 序列 及 其 结构 特点 具有 重要 的 参考 价值 。 
虽然 从 BLAST 分 析 结 果 中 来 看 ,并 不 能 很 明确 
所 克隆 的 序列 是 AP 基因 ,但 Conserved Domain 
Search 分 析 和 G0 分 析 所 提供 的 信息 使 我 们 相信 所 
克隆 的 序列 是 AP 基因 。AP 基因 编码 蛋白 的 功能 
主要 是 切割 多 聚 蛋白 体 , 也 即 蛋 白 与 蛋白 间 的 相互 
作用 ,因而 其 必定 含有 蛋白 结合 位 点 ,对 序列 的 生物 
言 息 学 分 析 也 证 实 了 这 一 点 。 此 外 该 序列 是 从 
Ty3/aypsy 反 转 座 子 中 克隆 获得 ,并 且 其 在 Ty3/ 
gypsy 反 转 座 子 中 的 位 置 符合 已 报道 的 AP 基因 的 
特征 ,结合 上 述 这 些 信息 ,我 们 确认 所 克隆 的 序列 就 
是 AP 基因 。 进 一 步 对 该 AP 基因 的 蛋白 二 级 结构 
分 析 , 和 蛋白 序 列 中 没有 信号 肽 结构 ,也 不 存在 跨 膜 
区 ,表明 AP 蛋白 是 在 胞 内 行使 功能 的 。 

在 二 化 蝇 不 同 地理 种 群 中 ,克隆 得 到 70 份 AP 
序列 拷贝 。 多 重 序列 比 对 结果 显示 碱 基 转 换 发 生 的 
次 数 明显 多 于 碱 基 颠 换 发 生 的 次 数 ,相同 的 现象 在 
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人 的 癌 基 因 变 异 中 也 存在 (Prathima, 2012)。 从 碱 
基 分 子 的 空间 构 像 上 分 析 , 嗓 叭 碱 基 均 有 两 个 环 , 喀 
啶 碱 基 都 只 有 一 个 环 ,个 体 大 小 相似 的 碱 基 之 间 发 
生 替 换 肯 定 比 一 大 一 小 之 间 发 生 替 换 容易 的 多 ,所 
以 碱 基 转 换 发 生 的 几率 会 大 于 碱 基 颠 换 发 生 的 几 
率 。 由 于 密码 子 的 兼并 性 ,所 以 密码 子 第 3 位 发 生 
的 变异 的 几率 必定 大 于 其 他 两 个 位 置 ,我 们 的 结果 
以 及 前 人 研究 的 结果 都 证 实 了 这 一 点 (Prathima， 
2012) 。 对 于 碱 基 蔡 换 的 形式 ,在 瘤 细 胞 基因 的 碱 
基 蔡 换 中 CT 和 GA 是 出 现 最 多 的 两 类 ,被 认为 
是 与 碱 基 的 甲 基 化 有 关 (Bird，1980; Arnheim and 
Calabrese, 2009; Prathima, 2012) 。 而 我 们 的 结果 
则 显示 在 反 转 座 子 的 AP 序列 中 AG £l TC 是 
出 现 最 多 的 两 类 碱 基 蔡 换 形式 。 在 癌 基 因 和 转 座 子 
基因 中 为 何 存在 这 种 差异 ,需要 更 深入 的 研究 。 这 
是 否 是 转 座 子 序列 变异 的 普遍 规律 ,也 值得 我 们 进 
一 步 研究 。 有 研究 表明 ,内 源 性 转 座 子 的 序列 甲 基 
化 是 转 座 子 保 持 失 活 状 态 的 一 个 重要 原因 ( Miura et 
al., 2001; Weil and Martienssen, 2008) 。 我 们 的 分 
析 结 果 显示 该 反 转 座 子 序列 倾向 于 向 “GLC” 的 变 







































































TEE T XR 

二 化 蜡 作 为 一 种 重要 的 农业 害虫 ,虽然 无 法 长 
距离 迁徙 ,但 却 广泛 分 布 。 我 们 所 选择 的 7 个 二 化 
晨 地 理 种 群 ,在 地 理 位 置 上 相隔 较 远 , 且 地 理 环境 与 
气候 条 件 差 异 明 显 , 但 都 属于 长 江 流域 范围 。Meng 
等 (2008 ) 基于 微 卫星 和 线粒体 DNA 将 我 国 二 化 量 
种 群 划分 成 3 大 分 支 华中 分 支 (central China, 
CC) ^E JE Ji Z& db 47 3x (northern plus northeastern 
China, NN) 和 西南 分 支 ( southwestern China, SW) , 
对 照 此 ,我 们 所 选 的 德阳 、 江 津 位 于 SW 4 3C VAL GI 
州 位 于 NN 分 广内 ; 湘 阴 、 瑞 昌 、 和 县 和 鄞县 位 于 CC 
分 广内 。 研 究 认 为 这 3 个 分 支 之 间 基 因 交 流 较 少 ， 
而 我 们 从 这 7 个 不 同 地 理 种 群 中 共 克 隆 得 到 70 份 
AP 序列 拷贝 ,有 着 极 高 的 相似 性 ,而 且 其 中 69 份 拷 
贝 均 具有 完整 的 ORF。 这 表明 ,尽管 宿主 二 化 旦 在 
不 同 地 理 区 域 中 需要 适应 各 自 所 处 的 地 理 环境 ,但 
它们 体内 的 反 转 座 子 序列 (AP 序列 ) 却 在 长 期 的 进 
化 过 程 中 保持 着 完整 的 序列 结构 。 我 们 推测 这 其 中 
可 能 有 两 个 原因 :第 一 ,本 实验 所 研究 的 该 AP 序列 
及 其 所 在 的 反 转 座 子 与 二 化 蜡 地 理 种 群 的 分 化 或 适 





















































异 , 这 可 能 会 增加 潜在 的 甲 基 化 位 点 ,从 而 使 转 座 子 
更 容易 受到 宿主 的 甲 基 化 调控 。 对 此 ,我 们 正在 更 
细致 地 研究 。 

转 座 子 是 宿主 进化 的 重要 内 在 动力 之 一 , 转 座 
子 能 够 通过 改变 宿主 的 某 些 重要 功能 基因 或 宿主 遗 
传 多 样 性 进而 提高 宿主 的 进化 适应 能 力 
( Beguiristain et al., 2001; Bohne et al., 2008; Oliver 
and Greene, 2009) 。 在 某 些 特殊 情况 下 ,宿主 能 够 
解除 对 其 体内 转 座 子 转 座 的 调控 ,从 而 提高 宿主 自 
身 的 环境 适应 能 力 , 因 此 宿主 体内 保留 具有 潜在 活 
性 的 转 座 子 对 宿主 具有 重要 的 生物 学 意义 
( Beguiristain et al., 2001; Dooner and Weil, 2007; 
Cam et al., 2008) 。 但 在 大 部 分 情况 下 , 转 座 子 的 转 
座 会 影响 宿主 的 某 些 正 常 功 能 基因 或 者 导致 宿主 染 
色 体 的 异常 重组 等 ,因此 转 座 子 的 转 座 受到 宿主 的 
严格 调控 (Beguiristain et al., 2001; Dooner and 
Weil, 2007 ; Bohne et al., 2008) 。 由 此 可 以 看 出 , 转 
座 子 与 宿主 存在 于 某 个 复杂 的 系统 中 ,这 一 定 程 度 
上 是 因为 转 座 子 与 宿主 基因 组 中 其 他 基因 之 间 有 着 
复杂 的 相互 关系 。 从 宏观 上 看 ,如 果 将 整个 宿主 基 
因 组 看 成 是 一 个 生态 系统 ,其 每 个 组 分 (如 一 个 基 
因 或 一 段 核酸 片段 ) 都 会 与 其 他 组 分 相互 影响 , 形 
成 一 定 的 互惠 关系 ,共生 关系 ,也 可 能 是 寄生 关系 
( Brookfield, 2005 ; 张 博 等 ,2009) 。 当 然 ,也 可 能 存 












































应 进化 可 能 没有 相关 性 。 第 二 ,或 许 是 该 AP 序列 
及 其 所 在 的 反 转 座 子 在 与 宿主 二 化 蜡 协 同 进 化 的 过 
程 中 对 宿主 进化 具有 重要 的 生物 学 意义 ,从 而 使 得 
自身 能 够 完整 的 在 宿主 体内 保存 下 来 。 因 为 在 多 数 
情况 下 ,宿主 对 转 座 子 的 调控 往往 都 使 转 座 子 丧失 
完整 性 而 失去 转 座 活性 (Wang ef al., 2008; Luo et 
al., 2011)。 此 前 ,我 们 在 二 化 坚 体 内 克隆 得 到 一 类 
DNA 型 转 座 子 ( CsuPLE ) 的 多 份 拷贝 ,并 且 这 些 拷 
贝 大 多 数 仍 具有 完整 的 序列 结构 ( 罗 光 华 等 ， 
2012) ,也 存在 着 上 述 相 似 的 情况 。 综 上 ,我 们 认为 
二 化 崇 在 长 期 的 进化 过 程 中 可 能 受到 其 体内 多 种 类 
型 转 座 子 的 影响 ,二 化 晨 体 内 多 种 转 座 子 的 存在 使 
其 拥有 更 丰富 的 遗传 多 样 性 。 我 们 正在 试图 寻找 到 
转 座 子 引起 的 二 化 蜡 种 群 差异 或 表 型 变化 , 为 揭示 
转 座 子 在 二 化 旦 种 群 进化 过 程 中 起 到 的 重要 作用 提 
供 确切 的 理论 证 据 。 
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